查看原文
其他

机器翻译是如何工作的?探索条件概率与贝叶斯公式的原理!

Masir123 科学羊 2024-03-31

大家好,我是科学羊🐑,这里是数学专栏概率论第3季第7篇。


在我们的日常生活中,许多看似无关的事件其实都是相互联系的。


举个直观的例子,今日的气候与昨天的天气状况息息相关;同样,在语言中,一个词的出现往往也受到其前一个词的影响。


这种前后相互依赖的现象,引领我们探索一个引人入胜的概念:条件概率


今天,就让我们一起揭开条件概率的神秘面纱,探究它是如何在数学的舞台上创造奇迹的。


01 什么是条件概率?


条件概率是在已知某事件发生的条件下,另一事件发生的概率。


用数学语言描述,假如事件A和事件B的概率都不是零(P(A)>0且P(B)>0),此时事件A在事件B基础上已发生的条件下发生的条件概率表示为P(A|B),计算公式为:



这里的是指事件A和事件B同时发生的概率。


举个例子:


假设有一副标准的52张扑克牌,你随机抽一张牌,我们来看两个事件:


  • 事件A:抽到的牌是红心(一共有13张红心牌)。

  • 事件B:抽到的牌是Q(一共有4张Q,分别是红心♥️Q、方块♦️Q、梅花Q♣️和黑桃Q♠️)。


我们想计算的是在已知抽到的牌是Q的情况下,这张Q是红心的概率,即P(A|B)。


首先,我们知道P(B)是抽到Q的概率,因为一共有4张Q,所以:P(B)=4/52


事件A和事件B同时发生,即抽到的牌既是Q也是红心,只有一张红心Q,所以:


因此,已知抽到的牌是Q的情况下,这张Q是红心的条件概率是:



这个结果意味着,如果你已经知道你抽到的牌是Q,那么这张Q是红心的概率是1/4。


好,接下来我们用通俗的方式来阐述下条件概率。


首先,让我们区分两个基本概念:“条件概率”与“无条件概率”。吴军老师在《数学通识》里举了这样一个例子:


以汉语中的同音词为例,"tian qi"在拼音中既可以指“天气”,也能指代中药“田七”。


在缺乏任何上下文的情况下,“天气”出现的可能性远超“田七”。


然而,如果在这个词组前加上“中药”二字,那么“田七”成为后续词汇的概率就会大大提高。


这就展示了条件概率的魅力所在:在特定条件下,某一事件发生的概率与其一般情况下发生的概率截然不同。


条件概率的存在,往往使得某些看似不可能的事件变得十分可能,而一些似乎很可能发生的事件也可能根本不会发生。


接下来,我们再通过一个简化的实例来近似理解条件概率的计算方法:假设在一大堆汉语文本中,某个词语“X”的出现频率是通过其出现次数除以总词数来近似计算的。


当我们加入特定的前置条件,比如“中药”,对于“天气”和“田七”这两个词的出现概率就会发生显著变化,这种变化正是条件概率的体现。


通过这个例子,我们不难发现,一个事件的条件概率不仅受到特定条件的影响,还取决于该条件与事件共同出现的频率。这个发现为我们理解和计算条件概率铺平了道路。


那么,条件概率的计算究竟是如何进行的呢?


我们采用一种直观的方式来理解:在给定条件“X”发生的情况下,事件“Y”发生的概率是这样计算的——“X”和“Y”同时出现的次数除以“X”出现的总次数。这种方法虽然简化了计算过程,但它揭示了条件概率的核心原理。


深入探究条件概率的本质,我们会发现它在解决实际问题中的巨大潜力,比如在机器翻译领域的应用。


02 什么是贝叶斯公式



托马斯·贝叶斯(Thomas Bayes,约1701年—1761年4月7日),18世纪英国数学家。1742年成为英国皇家学会会员。贝叶斯以其在概率论领域的研究闻名于世,他提出的贝叶斯定理对于现代概率论和数理统计的发展有重要的影响。他还曾在长老会担任牧师。


我们继续举例说明:


如上我们已经知道了已知抽到的牌是Q的情况下,这张Q是红心的条件概率是1/4。


个时候,假设有人告诉你,他们偷看了你抽的牌,并告诉你那张牌是红色的。在,你想知道在已知抽到的牌是红色的条件下,这张牌是红心的概率。这里就需要用到贝叶斯公式了。


在这个新的条件下,我们的样本空间缩小到了红色的牌,即红心和方块,共26张。我们知道牌是红色的,我们想要计算的是在这个新的条件下,牌是红心的概率。


贝叶斯公式可以帮助我们更新在新信息(牌是红色的)影响下,抽到红心的概率。在这个例子中,我们可以这样应用贝叶斯公式:



P(红心∣红色) 是我们想要计算的,在已知牌是红色的条件下,牌是红心的概率。

P(红色∣红心)=1,因为如果牌是红心,那么牌肯定是红色的。

P(红心) 是牌是红心的原始概率,即14。

P(红色) 是牌是红色的概率,即12,因为52张牌中有26张是红色的。


现在我们可以计在已知抽的牌是红色的条件下,这张牌是红心的概率是 P(红心∣红色) = 50%


这个例子展示了条件概率是如何直接计算在某个条件下事件发生的概率,而贝叶斯公式则是如何在获得新的信息后更新我们对事件发生概率的估计。


通过贝叶斯公式,我们可以将先前的概率(或称为“先验概率”)和新的证据结合起来,以得到一个更新后的概率(或称为“后验概率”)


贝叶斯公式是一种计算条件概率的方法,它基于已知的其他条件概率进行计算。贝叶斯公式如下:


通过运用条件概率和贝叶斯公式,我们可以将一个看似复杂的翻译问题转化为三个可以计算的概率问题,从而找出最佳的翻译方案。


这不仅展示了数学在语言处理中的强大能力,也让我们看到了条件概率在现实生活中的广泛应用。


总的来说,通过今天的探讨,我们不仅理解了条件概率的概念和计算方法,还见证了它如何在各种场景下发挥作用,从而解决了一些看似棘手的问题。


这些发现让我们认识到,在数学的世界里,通过建立条件与事件之间的联系,我们可以揭示出事物运作的深层逻辑,进而在生活中更加灵活地应用这些原理。


希望这次的分享能够激发大家对数学之美的进一步探索和思考。


好,今天就先这样啦!


科学羊🐏  2024/02/29

祝幸福~


参考文献:

[1].《吴军数学通识讲义》

感恩遇见,喜欢的话点个【在看】👍,有你们的支持是我最大的动力!




往期推荐



为什么宇宙自然的规律就是:一头富有,一头贫穷,而普通人在中间?

Sora已来,你准备好了吗?

这本300年前由拉丁文写的原著,目前只有2个英文版本,没有之一!解读《自然哲学的数学原理》背后的故事。

300年前,为什么他早早就证明出了行星运动规律,但迟迟不发表呢?

每天开车上班找不到停车位,怎么办?有一种方法能让你计算空余车位的可能!

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存